期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 基于高级语义特征蒸馏的增量式连续目标检测方法
康梦雪, 张金鹏, 马喆, 黄旭辉, 刘雅婷, 宋子壮
现代防御技术    2024, 52 (1): 41-48.   DOI: 10.3969/j.issn.1009-086x.2024.01.006
摘要37)   HTML3)    PDF (624KB)(46)   

现代防御要求智能感知算法具备复杂开放场景下增量式连续学习能力,而传统深度学习方法基于全体数据进行封闭训练,导致其应用能力和使用范围受限。现有连续学习算法面临灾难性知识遗忘问题,提出一种基于高级语义特征蒸馏的增量式连续目标检测方法,通过高级语义特征引导高价值底层特征的选择,将该特征从教师模型蒸馏到学生模型,从而有效促进旧任务知识传递,缓解灾难性知识遗忘。在公开图像数据集MS COCO上的实验表明,该方法在各类连续学习场景下的目标检测性能均超越先前最好方法,有望推动智能系统在动态开放场景下持续学习能力和自主遂行能力生成。

图表 | 参考文献 | 相关文章 | 多维度评价
2. 基于元课程强化学习的多智能体协同博弈技术
丁季时雨, 孙科武, 董博, 杨皙睿, 范长超, 马喆
现代防御技术    2022, 50 (5): 36-42.   DOI: 10.3969/j.issn.1009-086x.2022.05.006
摘要4780)   HTML298)    PDF (1899KB)(577)   

多智能体协同博弈具有实时及动作连续性、非完全信息博弈、庞大的搜索空间、多复杂任务和时间空间推理等特点,是当前人工智能领域极具挑战的难题之一。针对大规模多智能体强化学习训练时间长、难以收敛等问题,提出了一种基于Actor-Critic的多智能体强化学习协同博弈框架,利用元课程强化学习方法对小规模场景进行基础课程元模型提取,并且基于课程学习向大规模场景进行模型迁移,在元模型基础上继续进行训练,扩展元模型策略网络,最终得到较优协同博弈策略。在《星际争霸Ⅱ》平台上进行仿真实验,结果表明:基于元课程强化学习的多智能体协同博弈技术可有效地加速其训练过程,相较于传统训练方法可以在较短时间内达到较高的胜率,训练速度提升约40%,该方法可有效支撑多智能体协同博弈策略的高效生成,为低资源下的强化学习高效训练奠定理论基础。

图表 | 参考文献 | 相关文章 | 多维度评价